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AE000166 15505 bp DNA BCT 01-DEC-2000 

Escherichia coli K12 MG1655 section 56 of 400 of the complete 
genome . 

AE000166 U00096 
AE000166.1 GI:1786819 

Escherichia coli K12 . 
Escherichia coli K12 

Bacteria; Proteobacteria; gamma subdivision; Enterobacteriaceae; 
Escherichia. 
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Mau,B. and Shao,Y. 
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4 (bases 1 to 15505) 
Plunkett, G. III. 
Direct Submission 

Submitted ( 13-OCT-l 998 ) Laboratory of Genetics,' University of 
Wisconsin, 445 Henry Mall, Madison, WI 53706, USA 
This sequence was determined by the E. coli Genome Project at the 
University of Wisconsin-Madison (Frederick R. Blattner, director) . 
Supported by NIH grants HG00301 and HG01428 (from the Human Genome 
Project and NCHGR) . The entire sequence was independently 
determined from E. coli K12 strain MG1655. Predicted open reading 
frames were determined using GeneMark software, kindly supplied by 
Mark Borodovsky, Georgia Institute of Technology, Atlanta, GA, 
30332 [e-mail: mark@amber.gatech.edu]. Open reading frames that 
have been correlated with genetic loci are being annotated with CG 
Site Nos., unique ID nos . for the genes in the E. coli Genetic 
Stock Center (CGSC) database at Yale University, kindly supplied by 
Mary Berlyn. A public version of the database is accessible 
(http://cgsc.biology.yale.edu). Annotation of the genome is an 
ongoing task whose goal is to make the genome sequence more useful 
by correlating it with other data. Comments to the authors are 
appreciated. Updated information will be available at the E. coli 
Genome Project's World Wide Web site 

(http://www.genetics.wisc.edu). *** The E. coli K12 sequence and 
its annotations are periodically updated; this is version M54. No 
sequence changes. Annotation updates: updated gene identifications 
and products; all new functional assignments courtesy of Monica 
Riley; added promoters, protein binding sites, and repeated 
sequences described in reference 1. The unique numeric identifiers 
beginning with a lowercase f b f assigned to each gene (protein- or 
RNA-encoding) are now designated as gene synonyms instead of 
labels. This should allow them to be searched for in Entrez as gene 
names . 

Location/Qualifiers 
1. .15505 


/organism="Escherichia coli K12" 

/strain="K12" 

/sub_strain="MG1655" 

/db_xref="taxon: 83333" 
gene complement (104 . .1006) 

/gene="ybdO" 

/note="b0603" 
CDS complement (104 . .1006) 

/gene="ybdO" 

/f unction="putative regulator; Not classified" 
/note="f300; This 300 aa ORF is 29 pet identical (5 gaps) 
to 295 residues of an approx. 320 aa protein YBEF_ECOLI 
SW: P30979" 
/codon_start=l 
/trans l_table=ll 

/product="putative transcriptional regulator LYSR-type" 
/protein_id="AAC73704 .1" 
/db_xref="GI: 1786820" 

/translation="MANLYDLKKFDLNLLVIFECIYQHLSISKAAESLYITPSAVSQS 

LQRLRAQFNDPLFIRSGKGIAPTTTGLNLHHHLEKNLRGLEQTINIVNKSELKKNFII 

YGPQLISCSNNSMLIRCLRQDSSVEIECHDILMSAENAEELLVHRKADLVITQMPVIS 

RSVICMPLHTIRNTLICSNRHPRITDNSTYEQIMAEEFTQLISKSAGVDDIQMEIDER 

FMNRKISFRGSSLLTIINSIAVTDLLGIVPYELYNSYRDFLNLKEIKLEHPLPSIKLY 

ISYNKSSLNNLVFSRFIDRLNESF" 
promoter complement ( 1007 . .1034) 

/note="factor Sigma70; predicted +1 start at 636835" 
promoter complement ( 1018 . .1046) 

/note="factor Sigma70; predicted +1 start at 636846" 
promoter complement ( 1045 . .1071) 

/note="factor Sigma70; predicted +1 start at 636873" 
promoter complement ( 1081 . .1110) 

/note="factor Sigma70; predicted +1 start at 636909" 
promoter complement { 11 66 . .1196) 

/note="factor Sigma70; predicted +1 start at 636994" 
gene complement ( 1215 . .2021) 

/gene="dsbG" 

/note="b0604" 
CDS complement (1215. .2021) 

/gene="dsbG" 

/function="enzyme; Central intermediary metabolism: Pool, 
multipurpose conversions" 

/note="f268; This 268 aa ORF is 30 pet identical (31 gaps) 
to 220 residues of an approx. 240 aa protein DSBC_ECOLI 
SW: P21892" 
/codon_start=l 
/trans l_table=ll 

/product="thiol : disulfide interchange protein" 
/protein_id="AAC73705 .1" 
/db_xref="GI: 1786821" 

/ trans lation="MTVIGYAFYSTFALTEKDKLMLKKILLLALLPAIAFAEELPAPV 

KAIEKQGITIIKTFDAPGGMKGYLGKYQDMGVTIYLTPDGKHAISGYMYNEKGENLSN 

TLIEKEIYAPAGREMWQRMEQSHWLLDGKKDAPVI VYVFADPFCPYCKQFWQQARPWV 

DSGKVQLRTLLVGVIKPES PAT AAAILASKDPAKTWQQ YEAS GGKLKLNVPANVSTEQ 

MKVLSDNEKLMDDLGANVTPAIYYMSKENTLQQAVGLPDQKTLNIIMGNK" 
promoter complement (2127 . .2155) 

/note="factor Sigma70; predicted +1 start at 637955" 
promoter complement (2176 . .2206) 

/note="factor Sigma70; predicted +1 start at 638004" 
promoter 2232. .2261 

/note="factor Sigma70; predicted +1 start at 638103" 
protein_bind 2247. .2260 

/note="central position to predicted promoter: -13" 

/bound_moiety="OxyR predicted site" 
gene 2333. .2896 

/gene="ahpC" 

/note="b0605" 
CDS 2333. .2896 

/gene="ahpC" 

/EC_number="l. 6.4 .-" 

/function=" enzyme; Detoxification" 

/note="ol87; 100 pet identical to AHPC ECOLI SW: P26427" 


/codon_start=l 
/transl_table=ll 

/product="alkyl hydroperoxide reductase, C22 subunit; 
detoxification of hydroperoxides" 
/protein_id="AAC73706. 1" 
/db_xref="GI: 1786822" 

/ trans lation="MSLINTKIKPFKNQAFKNGEFIEITEKDTEGRWSVFFFYPADFT 

FVCPTELGDVADHYEELQKLGVDVYAVSTDTHFTHKAWHSSSETIAKIKYAMIGDPTG 

ALTRNFDNMREDEGLADRATFVVDPQGIIQAIEVTAEGIGRDASDLLRKIKAAQYVAS 

HPGEVCPAKWKEGEATLAPSLDLVGKI " 
repeat_region 2896. .3022 

/note="IRU" 
gene 3111. .4706 

/gene="ahpF" 

/note="b0606" 
CDS 3111. .4706 

/gene="ahpF" 

/ f unction=" enzyme; Detoxification" 

/note="o531; 100 pet identical to fragment AHPF_ECOLI 

SW:P35340 (162 aa) but contains additional N-ter and C ter 

residues" 

/codon_start=l 

/trans l_table=ll 

/product="alkyl hydroperoxide reductase, F52a subunit; 
detoxification of hydroperoxides" 
/protein_id="AAC73707 .1" 
/db_xref="GI: 1786823" 

/ translation="MMMFKAQEINMLDTNMKTQLKAYLEKLTKPVELIATLDDSAKSA 
EIKELLAEIAELSDKVTFKEDNSLPVRKPSFLITNPGSNQGPRFAGSPLGHEFTSLVL 
ALLWTGGHPSKEAQSLLEQIRHIDGDFEFETYYSLSCHNCPDWQALNLMSVLNPRIK 
HTAI DGGT FQNE I T DRNVMGVPAVFVNGKE FGQGRMTLTE I VAKI DTGAEKRAAEELN 
KRDAYDVLIVGSGPAGAAAAIYSARKGIRTGLMGERFGGQILDTVDIENYISVPKTEG 
QKLAGALKVHVDEYDVDVIDSQSASKLIPAAVEGGLHQIETASGAVLKARSIIVATGA 
KWRNMNVPGEDQYRTKGVTYCPHCDGPLFKGKRVAVIGGGNSGVEAAIDLAGIVEHVT 
LLEFAPEMKADQVLQDKLRSLKNVDIILNAQTTEVKGDGSKWGLEYRDRVSGDIHNI 
ELAGI FVQIGLLPNTNWLEGAVERNRMGEI I I DAKCETNVKGVFAAGDCTTVP YKQI I 
IATGEGAKASLSAFDYLIRTKTA" 

gene complement ( 4827 . .5255) 

/gene="ybdQ" 
/note-"b0607" 

CDS complement (4 827 . .5255) 

/gene="ybdQ" 

/f unction="orf ; Unknown" 

/note="fl42; This 142 aa ORF is 30 pet identical (4 gaps) 
to 126 residues of an approx. 152 aa protein YFMU_COXBU 
SW: P45680" 
/ codon_start=l 
/trans l_table=ll 

/product="orf , hypothetical protein" 
/protein_id="AAC73708 .1" 
/db_xref="GI:17 8 6824" 

/ translation="MYKTIIMPVDVFEMELSDKAVRHAEFLAQDDGVIHLLHVLPGSA 

SLSLHRFAADVRRFEEHLQHEAQERLQTMVSHFTIDPSRIKQHVRFGSVRDEVNELAE 

ELGADWVIGSRNPSISTHLLGSNASSVIRHANLPVLVVR" 
promoter complement ( 5274 . .5303) 

/note="factor Sigma70; predicted +1 start at 641102" 
promoter 5275. .5303 

/note="factor Sigma70; predicted +1 start at 641145" 
gene 5476. .6714 

/gene="ybdR" 

/note="b0608" 
CDS 5476. .6714 


Query Match 100.0%; Score 5484; DB 1; Length 15505; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 5484; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 gaacaacattcgttgcaaatcgataacaacatgcaccttcaggatactatttattatgtt 60 

•I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | M I I I I I I I 
Db 15299 GAACAACATTCGTTGCAAATCGATAACAACATGCACCTTCAGGATACTATTTATTATGTT 15240 


Qy ' ' 61 cggcaatgatattttcacccgcgtaaaacgttcagaaaataaaaaaatggcggaaatcgc 120 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 15239 CGGCAATGATATTTTCACCCGCGTAAAACGTTCAGAAAATAAAAAAATGGCGGAAATCGC 15180 

Qy 121 ccaattcctgcatgaaaatgatttgagcgttgacaccacagtcgaagtatttattaccgt 180 

I I I M I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I 
Db 1517 9 CCAATTCCTGCATGAA7VATGATTTGAGCGTTGACACCACAGTCGAAGTATTTATTACCGT 15120 

Qy 181 aacccgcgatgaaaagcttatcgcgtgcggtggaattgccggaaatattattaaatgcgt 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 15119 AACCCGCGATGAAAAGCTTATCGCGTGCGGTGGAATTGCCGGAAATATTATTAAATGCGT 15060 

Qy 241 tgctatcagtgaatccgtccgcggtgaaggactggcgctgacattagccactgaattgat 300 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 15059 TGCTATCAGTGAATCCGTCCGCGGTGAAGGACTGGCGCTGACATTAGCCACTGAATTGAT 15000 

Qy 301 aaacctcgcctatgagcggcacagcacgcatctgtttatttataccaaaaccgaatacga 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 14 999 AAACCTCGCCTATGAGCGGCACAGCACGCATCTGTTTATTTATACCAAAACCGAATACGA 14940 

Qy 361 ggcgctgttccgccagtgcggtttttccacgctgaccagcgtacccggcgtgatggtgct 420 

I I I I I I I M I II I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 14939 GGCGCTGTTCCGCCAGTGCGGTTTTTCCACGCTGACCAGCGTACCCGGCGTGATGGTGCT 14880 

Qy 421 gatggaaaacagcgccacgcgactgaaacgctatgccgaatcgctgaaaaaatttcgtca 480 

I I I I I I I II I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I M I I I I I I I I I I I I I 
Db 1487 9 GATGGAAAACAGCGCCACGCGACTGAAACGCTATGCCGAATCGCTGAAAAAATTTCGTCA 14 820 

Qy 481 tccagggaacaagattggctgcattgtgatgaacgccaatccctttacgaatggtcaccg 540 

I M I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I 
Db 14 819 TCCAGGGAACAAGATTGGCTGCATTGTGATGAACGCC7VATCCCTTTACGAATGGTCACCG 14 7 60 

Qy 541 ttatctgattcaacaggctgcggcacagtgcgactggttgcatctgtttttagtcaaaga 600 

M I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 1 I I I II I I I I I I I | | | | | | 
Db 14759 TTATCTGATTCAACAGGCTGCGGCACAGTGCGACTGGTTGCATCTGTTTTTAGTCAAAGA 14700 

Qy 601 agattcttcacgcttcccctatgaagaccggctggatttggtgttaaaaggcaccgccga 660 

M M M I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I M M I I I I I I I I I I 
Db 14 699 AGATTCTTCACGCTTCCCCTATGAAGACCGGCTGGATTTGGTGTTAAAAGGCACCGCCGA 14640 

Qy 661 tattccacgcctgactgtgcatcgtggctccgaatacatcatctcccgcgctacgttccc 720 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I II I 
Db 14 639 TATTCCACGCCTGACTGTGCATCGTGGCTCCGAATACATCATCTCCCGCGCTACGTTCCC 14580 

Qy 721 ttgctacttcattaaagaacagagcgtcattaaccattgttacaccgaaattgatctgaa 780 

I M I I I I I M I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | 
Db 14579 TTGCTACTTCATTAAAGAACAGAGCGTCATTAACCATTGTTACACCGAAATTGATCTGAA 14520 

Qy 781 gattttccgtcagtacctcgctcccgcgctgggtgtaactcaccgctttgtcggtactga 840 

I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II 
Db 14519 GATTTTCCGTCAGTACCTCGCTCCCGCGCTGGGTGTAACTCACCGCTTTGTCGGTACTGA 14460 

Qy 841 acccttttgtcgcgttaccgcccagtacaaccaggatatgcgctactggctggaaacgcc 900 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 14459 ACCCTTTTGTCGCGTTACCGCCCAGTACAACCAGGATATGCGCTACTGGCTGGAAACGCC 14 400 

Qy 901 gactatctccgcaccgcccatcgaactggttgaaattgagcggctgcgttaccaggagat 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I II M I I I I I I I M I I I 
Db 14 399 GACTATCTCCGCACCGCCCATCGAACTGGTTGAAATTGAGCGGCTGCGTTACCAGGAGAT 14 34 0 

Qy 961 gccgatatccgcttcccgggtacgtcaactgctggcgaaaaacgatctcacggctatcgc 1020 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I 
Db 14 339 GCCGATATCCGCTTCCCGGGTACGTCAACTGCTGGCGAAAAACGATCTCACGGCTATCGC 14280 

Qy 1021 gccgctggtccctgcagtcacgctgcattatttgcagaacctgcttgagcactcccgcca 1080 

I I I M I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 14279 GCCGCTGGTCCCTGCAGTCACGCTGCATTATTTGCAGAACCTGCTTGAGCACTCCCGCCA 14220 

Qy 1081 ggacgcggcagctcgtcaaaagacccccgcatgagaaacaggtgaaaaatgaaaataaac 1140 

I I I I I I I I II M I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 14219 GGACGCGGCAGCTCGTCAAAAGACCCCCGCATGAGAAACAGGTGAAAAATGAAAATAAAC 14160 


Qy ' 1141 cagcccgccgttgcaggcacccttgagtctggggatgtgatgatacgcatcgccccactc 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 14159 CAGCCCGCCGTTGCAGGCACCCTTGAGTCTGGGGATGTGATGATACGCATCGCCCCACTC 14100 

Qy 1201 gatacgcaggatatcgacctgcaaatcaatagcagcgttgagaaacagtttggcgatgca 1260 

I I II I M I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I II I I I I I I I I I I I I I M 
Db 14099 GATACGCAGGATATCGACCTGCAAATCAATAGCAGCGTTGAGAAACAGTTTGGCGATGCA 14 040 

Qy 12 61 attcgcaccaccattctggacgttctcgcccgctacaacgtgcgcggcgtacagctgaat 1320 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II II I I I I I I II I I I I I I I I I I I I I I 
Db 14039 ATTCGCACCACCATTCTGGACGTTCTCGCCCGCTACAACGTGCGCGGCGTACAGCTGAAT 13980 

Qy 1321 gtcgatgacaaaggcgcactggactgcattttacgtgcacgactggaagccctgctggca 1380 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I 
Db 13979 GTCGATGACAAAGGCGCACTGGACTGCATTTTACGTGCACGACTGGAAGCCCTGCTGGCA 13920 

Qy 1381 cgcgccagcggtatcccggctctgccatgggaggattgccaatgatttccgcttcgctgc 1440 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I II I I I II I I I I I I I I ( I I I II I I I I I I 
Db 13919 CGCGCCAGCGGTATCCCGGCTCTGCCATGGGAGGATTGCCAATGATTTCCGCTTCGCTGC 13860 

Qy 1441 aacaacgtaaaactcgcacccgccgcagcatgttgtttgtgcctggtgccaatgccgcga 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 
Db 13859 AACAACGTAAAACTCGCACCCGCCGCAGCATGTTGTTTGTGCCTGGTGCCAATGCCGCGA 13800 

Qy 1501 tggtcagcaactccttcatctacccggctgatgccctgatgtttgacctcgaagactccg 1560 

I I I I I I I I I I IE I II f I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 13799 TGGTCAGCAACTCCTTCATCTACCCGGCTGATGCCCTGATGTTTGACCTCGAAGACTCCG 13740 

Qy 1561 tagcattgcgtgaaaaagacaccgcccgccgcatggtttaccacgcgctgcaacatccgc 1620 

I I I I II I I I I I I I I I I I I II I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I t II I I I I 
Db 13739 TAGCATTGCGTGAAAAAGACACCGCCCGCCGCATGGTTTACCACGCGCTGCAACATCCGC 13680 

Qy 1621 tgtatcgcgatattgaaaccattgtgcgtgtcaacgcgctggattccgaatggggtgtta 1680 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I M I I II I I I I I I I I I I I I I I II 
Db 13679 TGTATCGCGATATTGAAACCATTGTGCGTGTCAACGCGCTGGATTCCGAATGGGGTGTTA 13620 

Qy 1681 acgacctggaagccgtcgttcgcggtggtgcggacgttgtgcgtctgccgaaaaccgata 1740 

I I I I I I I I I I I I I II I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 13619 ACGACCTGGAAGCCGTCGTTCGCGGTGGTGCGGACGTTGTGCGTCTGCCGAAAACCGATA 13560 

Qy 1741 ccgctcaggatgttctggatattgaaaaagagatcctgcgtatcgaaaaagcctgtggtc 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 13559 CCGCTCAGGATGTTCTGGATATTGAAAAAGAGATCCTGCGTATCGAAAAAGCCTGTGGTC 13500 

Qy 1801 gtgaacccggcagcaccggcctgctggcggcgattgaatctccgctggggattacccgcg 18 60 

I I I I II I I I I I I I I I I I I I I I II I I I I M I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 13499 GTGAACCCGGCAGCACCGGCCTGCTGGCGGCGATTGAATCTCCGCTGGGGATTACCCGCG 13440 

Qy 18 61 cagtggaaatcgctcacgcttccgagcgtttgatcggtatcgccctcggtgcagaagact 1920 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I M I I I I I I I I I II 
Db 13439 CAGTGGAAATCGCTCACGCTTCCGAGCGTTTGATCGGTATCGCCCTCGGTGCAGAAGACT 13380 

Qy 1921 atgtgcgcaacctgcgtacagaacgctccccggaaggaactgaactgctgttcgcacgct 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 13379 ATGTGCGCAACCTGCGTACAGAACGCTCCCCGGAAGGAACTGAACTGCTGTTCGCACGCT 13320 

Qy 1981 gttccattttgcaggccgcgcgctctgcgggtattcaggcgttcgataccgtctattccg 2040 

II I I I I I M II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 13319 GTTCCATTTTGCAGGCCGCGCGCTCTGCGGGTATTCAGGCGTTCGATACCGTCTATTCCG 13260 

Qy 2041 acgctaacaacgaagccggatttctgcaagaagccgcccacatcaaacagctgggctttg 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I II I I I I 
Db 13259 ACGCTAACAACG7VAGCCGGATTTCTGCAAGAAGCCGCCCACATCAAACAGCTGGGCTTTG 13200 

Qy 2101 acggcaaatcgctgatcaacccgcgtcagattgatctgctgcacaacctctacgcaccga 2160 

M I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I II I I I I I I 
Db 13199 ACGGCAAATCGCTGATCAACCCGCGTCAGATTGATCTGCTGCACAACCTCTACGCACCGA 13140 

Qy 2161 cccagaaagaagtggatcacgcccgccgcgtcgtagaagccgctgaagccgccgctcgcg 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II 
Db 13139 CCCAGAAAGAAGTGGATCACGCCCGCCGCGTCGTAGAAGCCGCTGAAGCCGCCGCTCGCG 13080 


Qy 

' 2221 

Db 

13079 

Qy 

2281 

Db 

13019 

Qy 

2341 

Db 

12959 

Qy 

2401 

Db 

12899 

Qy 

2461 

Db 

12839 

Qy 

2521 

Db 

12779 

Qy 

2581 

Db 

12719 

Qy 

2641 

Db 

12659 

Qy 

2701 

Db 

12599 

Qy 

2761 

Db 

12539 

Qy 

2821 

Db 

12479 

Qy 

2881 

Db 

12419 

Qy 

2941 

Db 

12359 

Qy 

3001 

Db 

12299 

Qy 

3061 

Db 

12239 

Qy 

3121 

Db 

12179 

Qy 

3181 

Db 

12119 

Qy 

3241 

Db 

12059 


aaggcctcggcgtggtttccctgaacggcaagatggtggacggtccggttatcgatcgcg 2280 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I M I I I I I I I 
AAGGCCTCGGCGTGGTTTCCCTGAACGGCAAGATGGTGGACGGTCCGGTTATCGATCGCG 13020 

cccgtctggtgctctcccgtgcagaactttccggcatccgcgaagaataaggcaatcaaa 2340 
I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I II I I I 
CCCGTCTGGTGCTCTCCCGTGCAGAACTTTCCGGCATCCGCGAAGAATAAGGCAATCAAA 12 960 

atgacgcagaaaattgaacaatctcaacgacaagaacgggtagcggcctggaatcgtcgc 2400 
I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I 
ATGACGCAGAAAATTGAACAATCTCAACGACAAGAACGGGTAGCGGCCTGGAATCGTCGC 12900 

gctgaatgcgatcttgccgctttccagaactcgccaaagcaaacctaccaggctgaaaaa 24 60 

I I I I I I II I I II I I I M I I I I I I I I I I I I I I I I I II I I I I M I I I I I I I M I I I I I I I I I 
GCTGAATGCGATCTTGCCGCTTTCCAGAACTCGCCAAAGCAAACCTACCAGGCTGAAAAA 12840 

gcgcgcgatcgcaaactgtgcgccaacctggaagaagcgattcgtcgctctggtttacag 2520 

II I I I I I II I I I I I I M I I I I I I I I I I I I I I I I I II I I I I i I I I I I I I I I I I I I I I I I II 
GCGCGCGATCGCAAACTGTGCGCCAACCTGGAAGAAGCGATTCGTCGCTCTGGTTTACAG 12780 

gacggcatgacggtttccttccatcacgctttccgtggcggtgacctgaccgtcaatatg 2580 
I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I II I I I 1 I I I I I 
GACGGCATGACGGTTTCCTTCCATCACGCTTTCCGTGGCGGTGACCTGACCGTCAATATG 12720 

gtgatggacgtcatcgcgaagatgggctttaaaaacctgaccctggcgtccagctccctg 2640 
I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I M I 
GTGATGGACGTCATCGCGAAGATGGGCTTTAAAAACCTGACCCTGGCGTCCAGCTCCCTG 12 660 

agtgattgccatgcgccgctggtagaacacattcgccagggcgtggttacccgcatttat 27 00 
I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGTGATTGCCATGCGCCGCTGGTAGAACACATTCGCCAGGGCGTGGTTACCCGCATTTAT 12 600 

acctccggcctgcgtggtccactggcggaagagatctcccgtggtctgctggcagaaccg 27 60 
I I I I I II I I I I I I M I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I II 
ACCTCCGGCCTGCGTGGTCCACTGGCGGAAGAGATCTCCCGTGGTCTGCTGGCAGAACCG 12540 

gtgcagatccactctcacggcggtcgtgtgcatctggtacagagcggcgaactgaatatc 2820 
M I I 1 I I I I II I I I I II I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I i I I I I I I I 
GTGCAGATCCACTCTCACGGCGGTCGTGTGCATCTGGTACAGAGCGGCGAACTGAATATC 124 80 

gacgtggctttcctcggcgtcccgtcctgtgatgaattcggtaatgccaacggctacacc 2880 
I I I M I I I I II I I I I I I I I I I I I I I I II I I I I II II I I I I I I I M I I I I I I I I I I I I I I I 
GACGTGGCTTTCCTCGGCGTCCCGTCCTGTGATGAATTCGGT7VATGCCAACGGCTACACC 12420 

ggtaaagcctgctgcggctccctcggctatgcaatagttgatgccgacaacgcaaaacag 2 940 
I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I II I I I 
GGTA/VAGCCTGCTGCGGCTCCCTCGGCTATGCAATAGTTGATGCCGACAACGCAAAACAG 12360 

gtcgtgatgcttaccgaagaactgctgccttatccgcataatccggcaagcattgagcaa 3000 
I I I I I I I I I I I I II I I I I I I M I I M I I I I I M I I I I I I I I I I I I II I I I I I I I I I I I I I 
GTCGTGATGCTTACCGAAGAACTGCTGCCTTATCCGCATAATCCGGCAAGCATTGAGCAA 12300 

gatcaggttgatttgatcgtcaaagttgaccgcgttggcgatgctgcaaaaatcggcgct 3060 
I I I I I I I II I I I I I I I I I I I I I I I I I.I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
GATCAGGTTGATTTGATCGTCAAAGTTGACCGCGTTGGCGATGCTGCAAAAATCGGCGCT 1224 0 

ggcgcgacccgtatgaccactaacccgcgcgaactgcttattgcccgtagcgctgcggat 3120 
I I I I I I I I I II I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I 
GGCGCGACCCGTATGACCACTAACCCGCGCGAACTGCTTATTGCCCGTAGCGCTGCGGAT 12180 

gtgattgtcaactctggctacttcaaagaaggtttctccatgcaaaccggcaccggcggc 3180 
I I I I I I I I I I I I I I I I I I I I I I I M M II I I I I I I I I I I I I II M I I I II I I I I I I I I I I 
GTGATTGTCAACTCTGGCTACTTCAAAGAAGGTTTCTCCATGCAAACCGGCACCGGCGGC 12120 

gcatcgctggcggtaacccgtttcctggaagacaaaatgcgtagccgcgatattcgcgcc 3240 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GCATCGCTGGCGGTAACCCGTTTCCTGGAAGACAAAATGCGTAGCCGCGATATTCGCGCC 12060 

gacttcgcccttggcggtattaccgcgacgatggttgacctgcacgaaaaaggtctgatc 3300 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GACTTCGCCCTTGGCGGTATTACCGCGACGATGGTTGACCTGCACGAAAAAGGTCTGATC 12000 


'Q# * 3301 cgcaaactgctggatgtgcagagctttgacagccatgctgcgcaatcgctggcccgtaac 
I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I II I I I I I I I M I I 
Db 11999 CGCAAACTGCTGGATGTGCAGAGCTTTGACAGCCATGCTGCGCAATCGCTGGCCCGTAAC 


Qy 3361 cccaatcacatcgaaatcagcgccaaccagtacgctaactggggttcgaaaggcgcatcg 
I I I I II I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 11939 CCCAATCACATCGAAATCAGCGCCAACCAGTACGCTAACTGGGGTTCGAAAGGCGCATCG 

Qy 3421 gttgatcgtctcgacgtggtggtactgagcgcgctggaaattgacacccagttcaacgtt 
I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1187 9 GTTGATCGTCTCGACGTGGTGGTACTGAGCGCGCTGGAAATTGACACCCAGTTCAACGTT 

Qy 3481 aacgtgctgaccggctctgacggcgtactgcgtggtgcttccggtggtcactgcgatacc 
I I I I I I I I I I I I I I M I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I II I I I I I 
Db 11819 AACGTGCTGACCGGCTCTGACGGCGTACTGCGTGGTGCTTCCGGTGGTCACTGCGATACC 

Qy 3541 gcgattgcctctgcgctttccatcatcgtcgcgccgctggtacgcggtcgtattccgact 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 11759 GCGATTGCCTCTGCGCTTTCCATCATCGTCGCGCCGCTGGTACGCGGTCGTATTCCGACT 

Qy 3601 ctggtggataacgtactgacctgcatcaccccaggctccagtgtcgatattctggtcaca 
I I I I I I II I I I II I I I I I I I I II I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 11699 CTGGTGGATAACGTACTGACCTGCATCACCCCAGGCTCCAGTGTCGATATTCTGGTCACA 

Qy 3661 gaccacggtatcgcagttaacccggcacgtccggaactggcagaacgtctgcaggaagcg 
I II II I M I II I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 11639 GACCACGGTATCGCAGTTAACCCGGCACGTCCGGAACTGGCAGAACGTCTGCAGGAAGCG 

Qy 3721 ggcattaaagtggtttccattgagtggctgcgcgaacgtgcgcgtctgctgaccggtgaa 
I I I I I I I I I I I I I I I I II I I I I M I I I I I I I I M I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 11579 GGCATTAAAGTGGTTTCCATTGAGTGGCTGCGCGAACGTGCGCGTCTGCTGACCGGTGAA 

Qy 3781 ccacagccgattgaattcacagaccgcgtcgttgccgttgtgcgttaccgcgatggctcg 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 11519 CCACAGCCGATTGAATTCACAGACCGCGTCGTTGCCGTTGTGCGTTACCGCGATGGCTCG 

Qy 3841 gtgatcgatgttgtgcatcaggtgaaggaataagccatgcacctgcttcctgaactcgcc 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I M I I I II I I II I I I I I I I I I I I I I I I M I 
Db 11459 GTGATCGATGTTGTGCATCAGGTGAAGGAATAAGCCATGCACCTGCTTCCTGAACTCGCC 

Qy 3901 agccaccatgcggtatcaattcccgagctgctcgtcagccgggatgaaaggcaagcacgg 
I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 11399 AGCCACCATGCGGTATCAATTCCCGAGCTGCTCGTCAGCCGGGATGAAAGGCAAGCACGG 

Qy 3961 caacacgtctggctcaagcgccatcctgttccactggtctcctttaccgtggttgcgcct 
I I II I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 11339 CAACACGTCTGGCTCAAGCGCCATCCTGTTCCACTGGTCTCCTTTACCGTGGTTGCGCCT 

Qy 4021 gggccgattaaagacagcgaggtcacacgccgaatttttaatcatggcgtgacagccttg 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1127 9 GGGCCGATTAAAGACAGCGAGGTCACACGCCGAATTTTTAATCATGGCGTGACAGCCTTG 

Qy 4 081 cgtgccttagccgcaaaacagggctggcaaattcaggagcaggctgcactggtttccgcc 
I I I I I I I II I I I I I II I I I I I I I II I I I I I M I I I I I I I I I I I I I I I I I I ! I I I M I I I I 
Db 11219 CGTGCCTTAGCCGCAAAACAGGGCTGGCAAATTCAGGAGCAGGCTGCACTGGTTTCCGCC 

Qy 4141 agcgggccggagggcatgttgagcattgccgccccggctcgcgacctcaagctcgccacc 
I I I I II I I I I I I I I I I I I I I I I I I I I I I M I I M I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 11159 AGCGGGCCGGAGGGCATGTTGAGCATTGCCGCCCCGGCTCGCGACCTCAAGCTCGCCACC 

Qy 4201 attgagcttgaacatagtcatcctctcgggcggttatgggatatcgatgtcctgacgccc 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 11099 ATTGAGCTTGAACATAGTCATCCTCTCGGGCGGTTATGGGATATCGATGTCCTGACGCCC 

Qy 42 61 gaaggcgaaattctctcccgccgcgactattcactgccgcctcgccgctgcctgttgtgc 
I I I I I I I I I I I I I I I I I ! II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 11039 GAAGGCGAAATTCTCTCCCGCCGCGACTATTCACTGCCGCCTCGCCGCTGCCTGTTGTGC 

Qy 4321 gaacaaagcgcagccgtctgcgcgcgtggaaaaacccatcaactgaccgatttactcaac 
I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I M II I I I I I I I I I I I I I I I I I 
Db 10 97 9 GAACAAAGCGCAGCCGTCTGCGCGCGTGGAAAAACCCATCAACTGACCGATTTACTCAAC 
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Q? 

* f 4381 

Db 
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Qy 

4441 

Db 

10859 

Qy 
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Db 
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Qy 
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Db 
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Qy 
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Db 

10679 

Qy 

4681 

Db 

10619 

Qy 

4741 

Db 

10559 

Qy 

4801 

Db 

10499 

Qy 
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Db 

10439 

Qy 

4921 

Db 

10379 

Qy 

4981 

Db 

10319 

Qy 

5041 

Db 

10259 

Qy 

5101 

Db 

10199 

Qy 

5161 

Db 

10139 

Qy 
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Db 

10079 

Qy 
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Db 

10019 

Qy 

5341 

Db 

9959 

Qy 

5401 

Db 

9899 


cgcatggaggcactgctgaacgatgtcgatgcctgcaacgtcaactaaaaccacaaagct 4 4 40 
I I I I I I I I I II I M I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
CGCATGGAGGCACTGCTGAACGATGTCGATGCCTGCAACGTCAACTAAAACCACAAAGCT 108 60 

tgcgacgtcattaatcgatgagtacgccctgctgggctggcgcgccatgctgactgaagt 4500 
I I I I I I I I I I M I I I I I I I I I I I II M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGCGACGTCATTAATCGATGAGTACGCCCTGCTGGGCTGGCGCGCCATGCTGACTGAAGT 10800 

caatctgtcaccgaaaccaggcctcgtggatcgcattaactgcggtgcgcacaaagatat 4560 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
CAATCTGTCACCGAAACCAGGCCTCGTGGATCGCATTAACTGCGGTGCGCACAAAGATAT 10740 

ggcgctggaagatttccaccgcagcgcgctggcgattcagggctggctaccccgtttcat 4 620 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
GGCGCTGGAAGATTTCCACCGCAGCGCGCTGGCGATTCAGGGCTGGCTACCCCGTTTCAT 10680 

tgaatttggtgcctgtagtgcggaaatggcaccagaagcggtactccacggattacgccc 4 680 

I II I 1 I I I I I I II I I I I M I I I I I I I I I I I I I II I I I I I I I I I II I I I I II I I I I I I I M 
TGAATTTGGTGCCTGTAGTGCGGAAATGGCACCAGAAGCGGTACTCCACGGATTACGCCC 10620 

aattggtatggcttgcgaaggtgatatgttccgcgccactgcgggcgtaaacacgcataa 4740 

II I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I II 
AATTGGTATGGCTTGCG7^AGGTGATATGTTCCGCGCCACTGCGGGCGTAAACACGCATAA 10560 

aggcagcattttttctttagggctgctatgtgcggcaattggccgtttgcttcaactcaa 4 800 
I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGGCAGCATTTTTTCTTTAGGGCTGCTATGTGCGGCAATTGGCCGTTTGCTTCAACTCAA 10500 

ccaaccggtaacgccaacaaccgtttgttctacggcggcaagtttctgccgtggcctgac 4 860 
I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I 
CCAACCGGTAACGCCAACAACCGTTTGTTCTACGGCGGCAAGTTTCTGCCGTGGCCTGAC 104 4 0 

cgatcgcgaactgcgtaccaataattcacaactgacggcaggtcaacggttgtaccaaca 4920 
I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I M 
CGATCGCGAACTGCGTACCAATAATTCACAACTGACGGCAGGTCAACGGTTGTACCAACA 10380 

gcttggccttaccggcgcacgcggtgaagccgaagcgggttatccactggtgatcaatca 4 980 
I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I M I I 
GCTTGGCCTTACCGGCGCACGCGGTGAAGCCGAAGCGGGTTATCCACTGGTGATCAATCA 10320 

cgccttgccgcattacctcactctgctggatcaggggttagatcctgaactggcattgct 504 0 
I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II 
CGCCTTGCCGCATTACCTCACTCTGCTGGATCAGGGGTTAGATCCTGAACTGGCATTGCT 102 60 

cgataccttgctcctactgatggcgatcaacggcgataccaacgttgcatcgcgcggtgg 5100 
I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
CGATACCTTGCTCCTACTGATGGCGATCAACGGCGATACCAACGTTGCATCGCGCGGTGG 10200 

cgaggggggcctgcgctggctacagcgcgaggcgcaaacattattgcaaaaagggggcat 5160 
I M I I I I I I I I I I I I I II I I I II I I I I I M I I I I I I I I I I I I II I II I I I I I I I I I II I I 
CGAGGGGGGCCTGCGCTGGCTACAGCGCGAGGCGCAAACATTATTGCAAAAAGGGGGCAT 1014 0 

tcgaacccccgccgatctcgattatctccggcagttcgacagggagtgtatcgaacgaaa 5220 

I I I I I M I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TCGAACCCCCGCCGATCTCGATTATCTCCGGCAGTTCGACAGGGAGTGTATCGAACGAAA 10080 

tctcagtccaggcggcagtgctgacctactgatccttacctggtttttagcacagattta 5280 

II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
TCTCAGTCCAGGCGGCAGTGCTGACCTACTGATCCTTACCTGGTTTTTAGCACAGATTTA 10020 

attatttaagcacttgataaatttggaaatattaattttcggagaacccgtatgtcttta 5340 
I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
ATTATTTAAGCACTTGATAAATTTGGAAATATTT^ATTTTCGGAGAACCCGTATGTCTTTA 9960 

gcaaaagataatatatggaaactattggccccactggtggtgatgggtgtcatgtttctt 54 00 
I I M I I I ! I I I I M I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I II I I I I | | | | | | 
GCAAAAGATAATATATGGAAACTATTGGCCCCACTGGTGGTGATGGGTGTCATGTTTCTT 9900 

atccctgtccccgacggtatgccgccgcaggcatggcattacttcgctgtgtttgtggca 54 60 
I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I | | | | | | | | | I | | | | | | | | | | | | | | 
ATCCCTGTCCCCGACGGTATGCCGCCGCAGGCATGGCATTACTTCGCTGTGTTTGTGGCA 984 0 


Q? * 5461 atgattgtcggcatgatcctcgag 5484 

I I I I I I I I I I I I I I I I I I I I I I I I 
Db 9839 ATGATTGTCGGCATGATCCTCGAG 9816 


